11 research outputs found

    Les eines computacionals i el disseny de corpus orals: un diàleg vigent

    Get PDF
    The design of an oral corpus and the processes of registering, codifying and treating the materials in order to build a useful resource for linguistic analysis prompt numerous decisions regarding theory and methodology. This article is focused on those stages of corpus construction which are more clearly conditioned by the computational processing necessary to make it functional. In order to adequately match the initial expectations and the real possibilities of using the tool, each feature we intend to codify must be measured against the workload and the means required to do so. Therefore, it is essential to take into account the available possibilities of processing and exploitation as they have a crucial impact on decisions regarding the corpus’ construction. Based on experience acquired in the construction of the ESLORA corpus, the present article looks into some of the problems arising in the process of designing an oral corpus, such as the delicacy with which oral phenomena are represented, the segmentation of the discourse, the coexistence of different simultaneous tagging systems and the particularities of annotation in a bilingual or multilingual contextEl disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus. Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissenyar un corpus oral, com ara el grau de detall en què és representat el fenomen oral, la segmentació del discurs, la convivència de diferents sistemes d’etiquetatge simultanis i les particularitats de l’anotació en un context bilingüe o multilingüeThis study was financed by the Agencia Estatal de Investigación (AEI) ‘Spanish State Research Agency’ and by the Fondo Europeo de Desarrollo Regional (FEDER) (European Regional Development Fund) through the ESLORA+ project (FFI2017-86379-P). The authors are members of the research group Gramática del español ‘Spanish Grammar’ from the University of Santiago de Compostela, which has been awarded a grant for the Strengthening and Organisation of Research Groups with Potential for Growth by the Regional Government’s Education Department (ED431B 2017/39). The study has also benefited from the participation of the ESLORA project in the Red temática en estudios de Análisis del Discurso (FFI2017-90738-REDT)S

    Construyendo emociones: sintaxis, frecuencia y función comunicativa

    Get PDF
    La codificación sintáctica de los eventos de proceso mental es objeto de atención en los estudios gramaticales y tipológicos debido a la diversidad de esquemas actanciales a que da lugar en numerosas lenguas

    Presentación

    Get PDF
    El volumen que presentamos quiere, y tal vez consiga, constituir un agradecido homenaje a quien en la universidad ha sido y es docente brillante, investigador lúcido, ges-tor eficiente y, sobre todo, compañero siempre más que dispuesto. A Guillermo Rojo somos muchos los que le debemos mucho, tanto directamente, por sus enseñanzas, dirección y apoyo académico y personal, como indirectamente, a través de su eficaz labor en la gestión de las distintas y numerosas instituciones en las que ha asumido responsabilidades que siempre han redundado en una mejora en las condiciones del trabajo universitario

    Dicionario contrastivo de valencias verbais: español-alemán

    No full text
    Das kontrastive Verbvalenzwörterbuch Spanisch - Deutsch (Diccionario contrastivo de valencias verbales español - alemán DCVVEA) liefert eine Beschreibung der kombinatorischen Möglichkeiten von über hundert hochfrequenten Verben des Spanischen und ihrer deutschen Äquivalente und macht präzise Angaben zu ihren semantischen und syntagmatischen Eigenschaften. Die Abgrenzung von Bedeutungsvarianten für die polysemen spanischen Lemmata geht zum einen von vorliegenden lexikographische Beschreibungen aus, die an die Zielsetzungen des DCVVEA angepasst wurden, und stützt sich zum anderen auf das empirische Datenmaterial, das die syntaktische Datenbank Base de datos sintácticos del español actual (BDS) zur Verfügung stellt. Die BDS wurde von WissenschaftlerInnen der USC unter der Leitung von Guillermo Rojo erstellt und enthält die Ergebnisse der syntaktischen Analyse von etwa 160.000 Sätzen aus einem Textkorpus der spanischen Gegenwartssprache, ARTHUS (Archivo de textos hispánicos de la Universidad de Santiago de Compostela). Das DCVVEA ist ein syntagmatisches Wörterbuch mit alphabetischer Struktur und Spanisch als Metasprache. Die Einträge beziehen sich auf die einzelnen Bedeutungsvarianten eines spanischen Verbs und werden mit authentischen Beispielen belegt. Den spanischen Verbvarianten werden deutsche Verben zugeordnet, die zu ihnen in einer vollständigen oder partiellen Äquivalenzrelation stehen. Die Ermittlung dieser Äquivalente stützt sich auf die Übersetzung der Korpusbeispiele. Die Valenzbeschreibung der spanischen und der deutschen Verbvarianten enthält funktionale, kategoriale und semantische Angaben zu den einzelnen Verbaktanten und explizite Hinweise auf kontrastiv relevante Unterschiede zwischen den Einheiten beider Sprachen.El diccionario ofrece la descripción de las propiedades combinatorias de más de cien verbos frecuentes del español y de sus equivalentes alemanes, con la especificación de sus características semánticas y sintagmáticas. El establecimiento de las acepciones de cada lema español parte de las descripciones lexicográficas existentes, que se adaptan a los objetivos del análisis valencial del DCVVEA, en conjunción con los datos empíricos que proporciona la Base de datos sintácticos del español actual (BDS), elaborada por investigadores de la USC bajo la dirección de Guillermo Rojo. La BDS contiene los resultados del análisis sintáctico de casi 160.000 cláusulas de un corpus textual de español contemporáneo, el corpus ARTHUS (Archivo de textos hispánicos de la Universidad de Santiago de Compostela). El DCVVEA es un diccionario sintagmático con una estructuración alfabética y con metalenguaje español. Las entradas parten de diferentes acepciones de significado de un verbo español, se documentan con ejemplos auténticos, y se asocian a una serie de equivalentes alemanes -plenos o parciales-, que se identifican a partir de la traducción de los ejemplos del corpus. La descripción valencial de las unidades verbales del español y del alemán incluye información funcional, categorial y semántica sobre los constituyentes actanciales, con indicación explícita de las características sintácticas diferenciales más relevantes (metataxis).O dicionario proporciona a descrición das propiedades combinatorias de máis de cen verbos frecuentes do español e dos seus equivalentes alemáns, coa especificación das súas características semánticas e sintagmáticas. O estabelecemento das acepcións de cada lema español parte das descricións lexicográficas existentes, que se adaptan aos obxectivos da análise valencial do DCVVEA, en conxunción cos datos empíricos que proporciona a Base de datos sintácticos do español actual (BDS), elaborada por investigadores da USC baixo a dirección de Guillermo Rojo. A BDS contén os resultados de analizar sintacticamente case 160.000 cláusulas dun corpus textual de español contemporáneo, o corpus ARTHUS (Arquivo de textos hispánicos da Universidade de Santiago de Compostela). O DCVVEA é un dicionario sintagmático cunha estruturación alfabética e con metalinguaxe española. As entradas parten de diferentes acepcións de significado dun verbo español, documéntanse con exemplos reais e asócianse a unha serie de equivalentes alemáns -plenos ou parciais-, que se identifican a partir da tradución dos exemplos do corpus. A descrición valencial das unidades verbais do español e do alemán inclúe información funcional, categorial e semántica sobre os constituíntes actanciais, con indicación explícita das características sintácticas diferenciais máis relevantes (metataxe)
    corecore